1
computer::
Script
زبان فارسی ، در تلاقی با جهان الکترونیکی ، به ویژه در رسم الخط ، دارای مشکلاتی است که کاوش در محتویات آن را مختل می نماید.
مسائل پردازش رایانه ای شامل عدم وجود واژگان، دستور زبان و الگوها و قواعد زبانی مدون وقابل درک برای ماشین، عدم وجود یک معیار قطعی در رسم الخط فارسی ، اختلاط رسم الخط رایانه ای فارسی و عربی، بحث فاصله ها و نیم فاصله ها و نبودن گنجینه واژگانی مطمئنی در زبان فارسی که به صورت مدون تهیه شده باشد.
در این روش ، مشکلات موجود در رسمالخط رایانه ای زبان فارسی در مورد حروفی که در رسم الخط رایانه ای دارای چند نوع حرف هستند حل شده است.
راهکارهای مشکلاتی که تحت تاثیر ساختار زبان هستند عبارتند از یک مرحله پیش پردازش شامل یکسان سازی کدگذاری نویسهها ، یکسان سازی رسم الخط، تشخیص مرز کلمات، حذف یا یکسان سازی اعراب گذاری و یکسانسازی املاهای مختلف کلمات انجام پذیرد.
یک ابزار کاوش توانمند ملی، منطبق با نیازهای اطلاعاتی کاربران فارسی زبان و با در نظر گرفتن چالش های رسم الخط فارسی و طراحی یک نرم افزار غلط یاب زبان فارسی راهگشا به نظر می رسد.
واژگان شبکه مترجمین ایران